Národní úložiště šedé literatury Nalezeno 4 záznamů.  Hledání trvalo 0.00 vteřin. 
Detektor tempa hudebních nahrávek na bázi neuronové sítě
Suchánek, Tomáš ; Smékal, Zdeněk (oponent) ; Ištvánek, Matěj (vedoucí práce)
Diplomová práce se zabývá systémy k detekci tempa a dob v hudebních nahrávkách, jejichž funkčnost je založena na neuronových sítích. Je zde popsána struktura těchto systémů a způsob zpracování signálu v jejich jednotlivých blocích. Pozornost je potom věnována především rekurentním a temporálním konvolučním sítím, které ze své podstaty detekci tempa a dob dokáží efektivně řešit. Vybrané metody, architektury sítí a jejich modifikace jsou pak implementovány v rámci uceleného detekčního systému, který je dále testován a vyhodnocen procesem křížové validace na žánrově rozmanitém datasetu. Z výsledků vyplývá, že systém s vlastní architekturou temporální konvoluční sítě dosahuje srovnatelných výsledků se zahraničními publikacemi – v rámci datasetu SMC se například projevil jako nejúspěšnější, naopak v případě jiných se nacházel mírně pod přesností state-of-the-art systémů, přičemž navržená síť si i přes zvýšenou vnitřní komplexnost zachovává nízkou výpočetní náročnost.
Automatické tagování hudebních děl pomocí metod strojového učení
Semela, René ; Galáž, Zoltán (oponent) ; Kiska, Tomáš (vedoucí práce)
Systémy pro automatické tagování hudebních děl jsou jednou z mnoha výzev pro obor strojového učení, a to zejména z hlediska komplexnosti celé této problematiky. Praktické uplatnění mohou tyto systémy nalézat zejména v obsahové analýze hudebních děl nebo při třídění obsahu hudebních knihoven. Tato práce se zabývá návrhem, trénováním, testováním a evaluací architektur umělých neuronových sítí pro automatické tagování hudebních děl. V úvodu je pozornost věnována položení ucelených teoretických základů pro tuto problematiku. V praktické části je pak navrženo 8 architektur neuronových sítí (4 plně konvoluční a 4 konvolučně-rekurentní). Tyto architektury jsou následně natrénovány za pomoci MagnaTagATune Dataset a mel spektrogramu a následně je provedeno jejich testování a evaluace. Nejlepších výsledků zde dosahuje čtyřvrstvá konvolučně-rekurentní neuronová síť (CRNN4) s hodnotou ROC-AUC = 0,9046 ± 0,0016. Jako další krok praktické části je vytvořen kompletně nový Last.fm Dataset 2020, který je sestaven díky napojení na API služeb Last.fm a Spotify. Tento nový dataset čítá 100 tagů a 122877 skladeb. Nejúspěšnější architektury jsou na tomto novém datasetu natrénovány, otestovány a evaluovány, a je tak položena základní hranice hodnot ROC-AUC, kterých lze za pomoci tohoto datasetu dosáhnout. Nejlepších výsledků zde dosahuje šestivrstvá plně konvoluční neuronová síť (FCNN6) s hodnotou ROC-AUC = 0,8590 ± 0,0011. Na závěr celé práce je vytvořena jednoduchá aplikace pro otestování jednotlivých architektur neuronových sítí na uživatelem vloženém zvukovém souboru. Práce se svými výsledky vyrovnává světovým pracím na stejné téma a přináší několik nových poznatků a inovací. Z hlediska inovací je zejména dosaženo podstatného snížení komplexnosti jednotlivých architektur neuronových sítí v porovnání se světovými pracemi při zachování podobných výsledků.
Detektor tempa hudebních nahrávek na bázi neuronové sítě
Suchánek, Tomáš ; Smékal, Zdeněk (oponent) ; Ištvánek, Matěj (vedoucí práce)
Diplomová práce se zabývá systémy k detekci tempa a dob v hudebních nahrávkách, jejichž funkčnost je založena na neuronových sítích. Je zde popsána struktura těchto systémů a způsob zpracování signálu v jejich jednotlivých blocích. Pozornost je potom věnována především rekurentním a temporálním konvolučním sítím, které ze své podstaty detekci tempa a dob dokáží efektivně řešit. Vybrané metody, architektury sítí a jejich modifikace jsou pak implementovány v rámci uceleného detekčního systému, který je dále testován a vyhodnocen procesem křížové validace na žánrově rozmanitém datasetu. Z výsledků vyplývá, že systém s vlastní architekturou temporální konvoluční sítě dosahuje srovnatelných výsledků se zahraničními publikacemi – v rámci datasetu SMC se například projevil jako nejúspěšnější, naopak v případě jiných se nacházel mírně pod přesností state-of-the-art systémů, přičemž navržená síť si i přes zvýšenou vnitřní komplexnost zachovává nízkou výpočetní náročnost.
Automatické tagování hudebních děl pomocí metod strojového učení
Semela, René ; Galáž, Zoltán (oponent) ; Kiska, Tomáš (vedoucí práce)
Systémy pro automatické tagování hudebních děl jsou jednou z mnoha výzev pro obor strojového učení, a to zejména z hlediska komplexnosti celé této problematiky. Praktické uplatnění mohou tyto systémy nalézat zejména v obsahové analýze hudebních děl nebo při třídění obsahu hudebních knihoven. Tato práce se zabývá návrhem, trénováním, testováním a evaluací architektur umělých neuronových sítí pro automatické tagování hudebních děl. V úvodu je pozornost věnována položení ucelených teoretických základů pro tuto problematiku. V praktické části je pak navrženo 8 architektur neuronových sítí (4 plně konvoluční a 4 konvolučně-rekurentní). Tyto architektury jsou následně natrénovány za pomoci MagnaTagATune Dataset a mel spektrogramu a následně je provedeno jejich testování a evaluace. Nejlepších výsledků zde dosahuje čtyřvrstvá konvolučně-rekurentní neuronová síť (CRNN4) s hodnotou ROC-AUC = 0,9046 ± 0,0016. Jako další krok praktické části je vytvořen kompletně nový Last.fm Dataset 2020, který je sestaven díky napojení na API služeb Last.fm a Spotify. Tento nový dataset čítá 100 tagů a 122877 skladeb. Nejúspěšnější architektury jsou na tomto novém datasetu natrénovány, otestovány a evaluovány, a je tak položena základní hranice hodnot ROC-AUC, kterých lze za pomoci tohoto datasetu dosáhnout. Nejlepších výsledků zde dosahuje šestivrstvá plně konvoluční neuronová síť (FCNN6) s hodnotou ROC-AUC = 0,8590 ± 0,0011. Na závěr celé práce je vytvořena jednoduchá aplikace pro otestování jednotlivých architektur neuronových sítí na uživatelem vloženém zvukovém souboru. Práce se svými výsledky vyrovnává světovým pracím na stejné téma a přináší několik nových poznatků a inovací. Z hlediska inovací je zejména dosaženo podstatného snížení komplexnosti jednotlivých architektur neuronových sítí v porovnání se světovými pracemi při zachování podobných výsledků.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.